令$ \ mathscr {f} _ {n,d} $为所有函数的类$ f:\ { - { - 1,1 \}^n \ to [-1,1] $ to $ n $ dipermensional discement to [-1,1] $超级立方体最多$ d $。在本文的第一部分中,我们证明了学习$ \ mathscr {f} _ {n,d} $的任何(确定性或随机)算法带有$ l_2 $ -accuracy $ \ varepsilon $至少需要$ \ omega( (1- \ sqrt {\ varepsilon})2^d \ log n)$ queries for tomy $ n $,从而将锋利性确定为$ n \ to \ fty \ fty \ infty $ y iffty $,eSkenazis and Ivanisvili(2021)(2021) 。为此,我们表明$ l_2 $ - 包装数字$ \ Mathsf {m}(\ Mathscr {f} _ {n,d},\ | \ cdot \ | _ {l_2},\ varepsilon)$概念类$ \ mathscr {f} _ {n,d} $满足双面估计$$ c(1- \ varepsilon)2^d \ log n \ log n \ leq \ log \ log \ mathsf {m mathsf {m}(\ mathscr) } _ {n,d},\ | \ cdot \ | _ {l_2},\ varepsilon)\ leq \ frac {2^{cd} \ log n} {\ varepsilon^4} $ n $ ,其中$ c,c> 0 $是通用常数。在本文的第二部分中,我们提出了一个对数上限,以实现有界近似多项式类别的随机查询复杂性,其傅立叶光谱集中在很少的子集上。作为应用程序,我们证明了学习给定程度的近似作者所需的随机查询数量的新估计值,具有快速衰减的傅立叶尾巴和给定尺寸的恒定深度电路的功能。最后,我们获得了学习多项式类$ \ mathscr {f} _ {n,d} $所需的查询数量的界限,而在查询和随机示例模型中没有错误。
translated by 谷歌翻译
如今,分布式文件系统已被广泛使用,但是使用其默认配置通常不是最佳的。同时,调整配置参数通常具有挑战性且耗时。它需要专业知识和调整操作也可能很昂贵。静态参数尤其是这种情况,仅在重新启动系统或工作负载后,更改才会生效。我们提出了一种新颖的方法,即Magpie,该方法利用深厚的加固学习来通过策略性探索和利用配置参数空间来调整静态参数。为了增强静态参数的调整,我们的方法使用分布式文件系统的服务器和客户端指标来了解静态参数与性能之间的关系。我们的经验评估结果表明,喜p可以明显改善分布式文件系统光泽的性能,在此过程中,我们的方法平均在朝着单个性能指标优化后,在默认配置方面取得了91.8%的吞吐量增益,而它达到39.7%的吞吐量增加了39.7%基线。
translated by 谷歌翻译
随着越来越多的数据,数据处理工作负载和其资源使用的管理变得越来越重要。由于管理专用基础架构是在许多情况下不可行或不经济的情况下,用户逐步执行其各自的工作负载在云中。由于工作负载和资源的配置通常是具有挑战性的,已经提出了各种方法,以便快速朝着良好的配置简化或基于先前运行的数据确定一个。仍然,培训此类方法的性能数据通常缺乏,并且必须昂贵地收集。在本文中,我们提出了一种协作方法,用于在用户之间共享匿名工作负载执行迹线,为常规模式进行挖掘,并利用历史工作负载的集群以供将来的优化。我们在公开可用的跟踪数据集上评估我们的原型实现,以便在公开的跟踪数据集上挖掘工作负载执行图,并演示通过迹线确定的工作负载群集的预测值。
translated by 谷歌翻译